class: title-slide, inverse, right, top background-image: url(data:image/png;base64,#02_img/logo-uc.png) background-position: 7% 13% background-size: 14%, cover <br> .right[ # Semana 5 ### <br> Regresión Discontinua y Diferencias en Diferencias ] <br> <br> <br> <br> .left[DCDPP - Datos para la evaluación de PolÃticas Públicas | PUC | 01 de noviembre, 2022] <hr> .left[
<b>Pablo A. Celhay</b> | [
pacelhay@uc.cl](mailto:pacelhay@uc.cl) ] --- layout:true <div class="my-footer"> <span style="width:100%; text-align:center">
Semana 5|
<a href=mailto:pacelhay@uc.cl style="color: white"> pacelhay@uc.cl |
PUC-Escuela de Gobierno 2022</a> </span> </div> --- name: sl0 class: inverse middle animated, fadeIn #.pull-left[.center-l[Outline]] .pull-right[ .center-r[ .large[ 1. [Regresión Discontinua](#rd) 2. [Diferencias en Diferencias](#did) ]]] --- name: rd class: inverse middle center animated, fadeIn ## 1. Regresión Discontinua --- class: animated, fadeIn ## Regresión Discontinua - Un diseño de regresión discontinua es una estrategia de identificación muy poderosa, convincente y aplicable a un gran rango de situaciones - Es común observar que el acceso o los incentivos a participar en un programa están basados en reglas transparentes de un criterio utiliza puntos de corte -- ¿Caso más claro cuando uno postula a una carrera en la U? - Comparar individuos similares pero en distintos lados de este punto de corte puede ser una forma creÃble de estimar efectos de un tratamiento. - RD funciona bien para validez interna -- ¿Qué es esto? -- pero no mucho para validez externa --- class: animated, fadeIn ## RD Sharp **Ejemplo 1: ¿Cuál es el efecto de ser incumbente en la probabilidad de ganar la siguiente elección?** - ¿Cuál es la probabilidad de que una PC/PPD/UDI gane la próxima elección dado que una PC/PPD/UDI gano la última elección? - Siguiendo nuestra terminologÃa: - `\(Y_i\)`: probabilidad de ganar la elección en `\(t+1\)` en el distrito `\(i\)` - `\(D_i = 1\)` si la última elección la ganó un PC/PPD/UDI - ¿Es `\(D_i\)` asignado de manera aleatoria en la realidad? - ¿Cómo podemos estimar el efecto causal de `\(D_i\)` sobre `\(Y_i\)` ? -- - Lee (2008) compara resultados electorales en casos donde la elección anterior fue ganada por un margen muy pequeño --- class: animated, fadeIn ## Visualización: ¿Cómo cambia la probabilidad de ganar? <img src="data:image/png;base64,#02_img/rdd1.png" width="50%" style="display: block; margin: auto;" /> - `\(D_i = 1\)` si la última elección (tiempo `\(t\)`) la ganó un demócrata - `\(X_i\)`: es la variable de asignación (o **running variable**) en el eje x --- class: animated, fadeIn ## Visualización: ¿Cómo cambia la probabilidad de ganar? <img src="data:image/png;base64,#02_img/rdd2.png" width="50%" style="display: block; margin: auto;" /> - `\(Y_i\)` : es la probabilidad de que un demócrata gane en `\(t+1\)` en el distrito `\(i\)` - `\(X_i\)`: es la variable de asignación (o **running variable**) en el eje x --- class: animated, fadeIn ## RD Sharp - `\(D_i \in \{0,1\}\)`: Tratamiento - `\(X_i\)`: variable de asignación que determina de manera perfecta el valor de `\(D_i\)`. Sea `\(c\)` un punto de corte de esta variable `\(X_i\)`\\ `\(D_i = 1\{X_i>c\}\)` o bien `\(D_i=1\)` si `\(X_i>c\)` y `\(D_i=0\)` si `\(X_i\geq 0\)` - `\(X_i\)` puede estar correlacionado con `\(Y_{1i}\)` o `\(Y_{0i}\)` de manera directa o a través de variable no observadas. - La intuición clave y básica es que en el punto de corte `\(X_i=c\)`, el hecho de que una unidad de análisis sea tratada ($D_i=1$) y otra no ($D_i=0$) es similar a un proceso aleatorio --- class: animated, fadeIn ## RD Sharp **Ejemplo 2: ¿Cuál es el efecto de becas para la Universidad?** - Las becas se dan en función de los resultados de un test de admisión a la Universidad (PSU) - `\(Y_i\)`: Salarios post universidad - `\(D_i = 1\)` si la unidad `\(i\)` recibe la beca - `\(Y_{1i}\)`: Salarios potenciales con beca - `\(Y_{0i}\)`: Salarios potenciales sin beca -- - `\(Y_{1i}\)` y `\(Y_{0i}\)` están correlacionados con `\(X_i\)`: -- ¿Por qué? -- en promedio alumn@s con mejor PSU tienen mayores salarios. --- class: animated, fadeIn ## Visualización: ¿Cómo cambia la probabilidad de ganar? <img src="data:image/png;base64,#02_img/rdd3.png" width="50%" style="display: block; margin: auto;" /> - `\(D_i = 1\)` si obtiene beca - `\(X_i\)`: es la variable de asignación (o **running variable**) en el eje x: Puntaje PSU --- class: animated, fadeIn ## RD Sharp - Supuesto clave: Continuidad en los resultados potenciales - `\(E(Y_{i}|X=x_i)\)` es continua en `\(x\)` alrededor de `\(X_i=c\)` - El estimador causal: ATE local alrededor del punto de corte: `\(\tau_{srd}=\)` -- ¿Cómo es ATE? ¿Cómo serÃa el estimador en el corte? -- `\(\tau_{srd}=E(Y_{1i}-Y_{0i}|X=c)\)` -- - ¿Validez externa? - Si tenemos continuidad en `\(X_i\)` -- `$$\tau_{srd}=lim_{x \to c^{-}} E(Y_{i}|X=x) - lim_{x \to c^{+}} E(Y_{i}|X=x)$$` --- class: animated, fadeIn ## Visualización: Estimando efectos <img src="data:image/png;base64,#02_img/rdd4.png" width="65%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización: Estimando efectos <img src="data:image/png;base64,#02_img/rdd5.png" width="65%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización: Estimando efectos <img src="data:image/png;base64,#02_img/rdd6.png" width="65%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización: Estimando efectos <img src="data:image/png;base64,#02_img/rdd7.png" width="65%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización: Estimando efectos <img src="data:image/png;base64,#02_img/rdd8.png" width="65%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización: Estimando efectos <img src="data:image/png;base64,#02_img/rdd9.png" width="65%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## RD Sharp: Estimación - Concentrarse en una parte de la muestra alrededor del punto de corte - `\(c-h\leq X_i \leq c+h\)` donde `\(h\)` es un ancho de banda (vecindad o ventana) - Recodificar la variable `\(X_i\)` en "esviaciones de c": `\(X_i=X_i - c\)` - `\(X_i=0\)` si `\(X_i=c\)` - `\(X_i>0\)` si `\(X_i>c\)` `\(\rightarrow D_i=1\)` - `\(X_i<0\)` si `\(X_i<c\)` `\(\rightarrow D_i=0\)` - Decidir en el modelo para `\(E[Y_i | X_i]\)`: - Lineal con pendiente común a cada lado del corte - Lineal con pendientes distintas - No lineal - Cada modelo se construe en base a cupuestos sobre los resultados potenciales y los contrafactuales - Siempre hay que empezar con una exploración visual (scatter) para ver qué modelo es más plausible --- class: animated, fadeIn ## RD Sharp: Problemas en estimación 1. Otras variables cambian alrededor del punto de corte - Revisar si hay saltos en otras variables 2. Hay discontinuidades en otras valores de la variable `\(X_i\)` distintos de `\(c\)` 3. Manipulación del punto de `\(X_i\)` alrededor de `\(c\)` - Verificar continuidad de la denisdad (número de obs.) alrededor de `\(c\)`. --- class: animated, fadeIn ## Visualización: Manipulación <img src="data:image/png;base64,#02_img/rdd10.png" width="75%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Malamud, O., and C. Pop-Eleches. 2011 - ¿Qué pregunta quieren responder? -- - ¿Cómo afecta el uso de computadores los resultados escolares? -- - ¿Porqué es importante mejorar el acceso a computadores? -- - Si hay beneficios importantes de accceder a nuevas tecnologÃas, esto podrÃa generar brechas socioeconómicas aún mayores -- **¿Porqué?** -- - ¿Cuál es su sÃmil en Chile? --- class: animated, fadeIn ## Malamud, O., and C. Pop-Eleches. 2011 <img src="data:image/png;base64,#02_img/mahlamud1.jpg" width="75%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Malamud, O., and C. Pop-Eleches. 2011 - Buscan estimar el efecto causal de acceder a una computadora en casa en el capital humano de l@s niñ@s que se benefician. - Programa del Ministerio de Educación de Rumania - Programa tenÃa disponible un número fijo de vouchers para comparar computadores - ¿Cómo se eligieron beneficiarios? -- En función de un ranking de ingreso familiar - ¿Porqué es importante este mecanismo de asignación de computadores para la evaluación empÃrica? --- class: animated, fadeIn ## Malamud, O., and C. Pop-Eleches. 2011 - Yo Elijo mi PC: TeorÃa de Cambio (Gertler et al. 2010) -- - ¿Cuál es el objetivo de YEPC? (pág. 4) -- **Insumos:** Recursos financieros, humanos u otros... -- **YEPC** Presupuesto, Número de computadores, hogares con necesidad. -- **Actividades:** Acciones emprendidas que transforman insumos en productos... -- **YEPC** Entrega de computadores a familias, uso de computadores por integrantes del hogar, --- class: animated, fadeIn ## Malamud, O., and C. Pop-Eleches. 2011 - Yo Elijo mi PC: TeorÃa de Cambio (Gertler et al. 2010) **Productos:** Productos resultantes de la transformación de insumos a productos tangibles... -- **YEPC** Computadores efectivamente instalados en hogares beneficiarios, computadores en funcionamiento -- ¿Es esto obvio? <img src="data:image/png;base64,#02_img/mahlamud2.png" width="50%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Malamud, O., and C. Pop-Eleches. 2011 - Yo Elijo mi PC: TeorÃa de Cambio (Gertler et al. 2010) **Productos:** Productos resultantes de la transformación de insumos a productos tangibles... **YEPC** Computadores efectivamente instalados en hogares beneficiarios, computadores en funcionamiento **Resultados:** uso de los productos que realiza la población beneficiaria -- **YEPC** Número de computadores en uso, horas de uso, tipos de uso (aprendizaje o recreación) -- **Resultados finales:** Objetivo final del programa -- **YEPC** Mejora puntajes de pruebas estandarizadas y disminuye brecha en test std entre alumn@s de distinto SES, reduce tasa de deserción escolar, mejora empleabilidad, etc. --- class: animated, fadeIn ## Antes de ver el detalle - Pensemos junt@s la regresión que Malamud, O., and C. Pop-Eleches. 2011 deberÃan correr -- - ¿Cuál es la pregunta de impacto aquÃ? -- - ¿Cuál es el escenario contrafactual? -- - ¿Qué datos necesitamos? -- - Con estos datos, ¿cómo escribimos la regresión para el análisis de impacto? -- - ¿Cómo estimamos esta regresión? ¿Qué supuestos hay detrás? -- - `\(y_i = \alpha + \delta D_i + f(ingreso_i) \varepsilon_i\)` - ¿Qué es `\(y_i\)`? - ¿Qué es `\(i\)`? -- - ¿Qué es `\(D_i\)`? - ¿Qué es `\(f(ingreso_i)\)`? --- class: animated, fadeIn ## Inspección visual: Resultados de Corto Plazo <img src="data:image/png;base64,#02_img/mahlamud3.png" width="50%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Inspección visual: Resultados de Corto Plazo <img src="data:image/png;base64,#02_img/mahlamud4.png" width="50%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Inspección visual: Resultados de Corto Plazo <img src="data:image/png;base64,#02_img/mahlamud5.png" width="50%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Inspección visual: Resultados de Corto Plazo <img src="data:image/png;base64,#02_img/mahlamud6.png" width="50%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Inspección visual: Resultados de Corto Plazo <img src="data:image/png;base64,#02_img/mahlamud7.png" width="50%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Estimación <img src="data:image/png;base64,#02_img/mahlamud8.png" width="75%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Inspección visual: Resultados Intermedios <img src="data:image/png;base64,#02_img/mahlamud9.png" width="45%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Inspección visual: Resultados Finales <img src="data:image/png;base64,#02_img/mahlamud11.png" width="45%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Estimación <img src="data:image/png;base64,#02_img/mahlamud10.png" width="75%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Inspección visual: Resultados Finales 2 <img src="data:image/png;base64,#02_img/mahlamud12.png" width="45%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Estimación <img src="data:image/png;base64,#02_img/mahlamud13.png" width="75%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Heterogeneidad por reglas sobre uso de PC <img src="data:image/png;base64,#02_img/mahlamud14.png" width="75%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Conclusiones - Estudiantes que reciben el computador tienen peores notas en el colegio: de casi 1/3 de SD (efecto grande). - Pero reportan mejores resultados en tests de habilidades para utilizar un computador (computer fluency) - Algo de evidencia de que los ganadores del voucher mejoran sus habilidades cognitivas (test de Raven) - Las reglas parentales sirven como mediadroes de estos efectos: Ej., reglas sobre tareas median los efectos negativos del computador en las notas - El efecto neto de entregar computadores es incierto: -- **¿Porqué?** --- name: did class: inverse middle center animated, fadeIn ## 2. Diferencias en Diferencias --- class: animated, fadeIn ## Diferencias en Diferencias (Experimentos Naturales) - Cuando no existe un experimento controlado en donde se asignan aleatoriamente personas a un grupo de control o tratamiento, se buscan **experimentos naturales** - Por ejemplo, ¿cuál es el efecto de la contaminación sobre mortalidad? No podemos asignar aleatoriamente personas a distintos niveles de contaminación - Los experimentos naturales son eventos exógenos que cambian el ambiente en que individuos, familias, empresas, ciudades, u otros, operan. - .red[¿Exógeno?] - TÃpicamente son una ley o polÃtica que cambia o fue implementada de manera diferenciada en distintos lugares o para distintas personas. - La clave está en qué este experimento natural **causa** diferencias en nuestra variable de resultado, ya sea a través del espacio, tiempo, o individuos --- class: animated, fadeIn ## Identificación - Una **estrategia de identificación** se refiere a cómo un investigador usa datos no experimentales para aproximarse a un experimento real. - Una evaluación de impacto descansa en los **supuestos de identificación** para aislar el efecto de una polÃtica de otras variables que podrÃan confundir su interpretación (hint: sesgo de selección o sesgo de variable omitida) - ¿Cuál es el supuesto de identificación en un modelo de MCO? (hint: MELI) - La parte difÃcil en métodos no-experimentales es decidir cuáles supuestos de identificación son posibles y cuáles no. --- class: animated, fadeIn ## Datos de panel - Muchos métodos no experimentales utilizan Una **datos de panel** - Datos de corte transversal: observaciones en un perÃodo del tiempo - Datos de panel: múltiples observaciones para una misma unidad en el tiempo - Datos de corte transversal repetidos: Similar a datos de panel pero se colectan para distintas unidades (personas) - ¿Ejemplos en Chile? - Algunas preguntas que se pueden responder con datos de panel: - ¿Cuál es el impacto de la regulación ambiental sobre mortalidad infantil? - ¿Cómo afecta una extensión del postnatal las decisiones laborales de las madres? - ¿Cuál es el impacto del plan AUGE sobre tasas de utilización de servicios de salud y salud? --- class: animated, fadeIn ## Estimador de diferencias - Usualmente se observa (se tiene información) de personas antes de que entren a un programa y después de que el programa termina. - Estos datos pueden ser muy útiles cuando queremos evaluar un programa. - Un estimador posible del impacto del programa con estos datos es ver el **cambio** antes y después del programa en nuestra variable de resultado - Estimador de **diferencias** o el estimador "Antes y Después" --- class: animated, fadeIn ## Estimador "Antes y Después" - Supongamos que todas las personas fueron tratadas bajo un programa. El estimador de diferencias se construye cómo: `$$\Delta^{d}=\bar{Y}^{T}_{1,t_1} - \bar{Y}^{T}_{0,t_0}$$` - Esta notación es la que utilizaremos. Pero lo que se simplifica es: - `\(\bar{Y}^{T}_{1,t_1}\)` es equivalente a `\(E[Y_{1i}| D=1, t=1]\)` - `\(\bar{Y}^{T}_{0,t_0}\)` es equivalente a `\(E[Y_{0i}| D=1, t=0]\)` --- class: animated, fadeIn ## Estimador "Antes y Después" - El estimador AD descansa en el **supuesto de identificación** de que el resultado de interés no cambia e la ausencia del programa. - ¿Qué concepto esta relacionado a este supuesto? `$$\begin{align} \Delta^{d}&=\bar{Y}^{T}_{1,t_1} - \bar{Y}^{T}_{0,t_0}\\ &=\bar{Y}^{T}_{1,t_1} - \bar{Y}^{T}_{0,t_0} + \bar{Y}^{T}_{0,t_1} - \bar{Y}^{T}_{0,t_1} \\ &=(\bar{Y}^{T}_{1,t_1} - \bar{Y}^{T}_{0,t_1}) + (\bar{Y}^{T}_{0,t_1} - \bar{Y}^{T}_{0,t_0}) \\ &=\Delta^{ATET} + \textit{tendencia contrafactual del grupo de tratamiento} \end{align}$$` -- - El **supuesto de identificación** es que el segundo término es igual a cero. --- class: animated, fadeIn ## Estimador "Antes y Después" - El segundo término es el contrafactual que no tenemos: ¿Qué hubiese pasado al grupo de tratamiento de no haber sido tratado? `\(\rightarrow\)` no podemos revisar si el supuesto es válido. - Sin evidencia directa sobre la tendencia del contrafactual, uno podrÃa mirar tendencias antes del programa para el grupo de tratamiento. En muchos casos, este supuesto no es razonable. -- ¿Porqué? -- - El estimador AD no es un buen estimador de impacto: incluye el efecto del programa y una tendencia contrafactual que "contamina" la estimación - Para mejorar el AD uno necesita simular esta tendencia contrafactual con un grupo de control: Esto nos lleva al estimador de **Diferencias en Diferencias** --- class: animated, fadeIn ## Estimador de Diferencias en Diferencias - Necesitamos estimar la tendencia contrafactual para el grupo de tratamiento - Un estimador posible es la tendencia observada para un grupo que no recibió el tratamiento o programa en un mismo perÃodo - El estimador de diferencias en diferencias se construye como: `$$\begin{align} \Delta^{DID}&=\Delta_{D=1}^{d} - \Delta_{D=0}^{d}\\ &=\underbrace{(\bar{Y}^{T}_{1,t_1} - \bar{Y}^{T}_{0,t_0})}_{\textit{Diferencias}} \underbrace{-}_{\textit{en}} \underbrace{(\bar{Y}^{C}_{0,t_1} - \bar{Y}^{C}_{0,t_0})}_{Diferencias} \end{align}$$` - El trabajo esta en encontrar un grupo de personas no tratadas y datos en los mismos perÃodos --- class: animated, fadeIn ## Estimador de Diferencias en Diferencias - El estimador DID descansa en el **supuesto de identificación** de que la tendencia observada del grupo de control es la misma que la tendencia contrafactual del tratamiento. ¿Qué tan bueno es mi grupo de control? `$$\begin{align} \Delta^{DID}&=(\bar{Y}^{T}_{1,t_1} - \bar{Y}^{T}_{0,t_0}) - (\bar{Y}^{C}_{0,t_1} - \bar{Y}^{C}_{0,t_0})\\ &= (\bar{Y}^{T}_{1,t_1} - \bar{Y}^{T}_{0,t_0}) - (\bar{Y}^{C}_{0,t_1} - \bar{Y}^{C}_{0,t_0}) + \bar{Y}^{T}_{0,t_1} - \bar{Y}^{T}_{0,t_1} \\ &= (\bar{Y}^{T}_{1,t_1} - \bar{Y}^{T}_{0,t_1}) - (\bar{Y}^{T}_{0,t_1} - \bar{Y}^{T}_{0,t_0}) - (\bar{Y}^{C}_{0,t_1} - \bar{Y}^{C}_{0,t_0}) \\ &= \Delta^{ATET} + \textit{tendencia contrafactual del grupo de tratamiento}\\ & - \textit{tendencia del grupo de control} \end{align}$$` - El **supuesto de identificación** es que ambos grupos tendrÃan la misma tendencia en la ausencia del tratamiento. Esto se llama **supuesto de tendencias paralelas**. --- class: animated, fadeIn ## Visualización: lo que queremos estimar <img src="data:image/png;base64,#02_img/did1.png" width="75%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización: lo que estima AD <img src="data:image/png;base64,#02_img/did2.png" width="75%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización: lo que estima DID <img src="data:image/png;base64,#02_img/did3.png" width="75%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Ejemplo 1: Brote de cólera en Londres en 1854 **John Snow (1854)** - Dos compañÃas de agua compiten por clientes en algunas regiones del sur del rÃo Thames: Lambeth Company (LC) y Southwark and Vauxhall (SV) - En 16 sub-distritos (300,000 habitantes), competÃan de manera directa y en algunos casos entregaban agua a los mismos hogares - Cada compañÃa proveÃa de agua a grupos de hogares muy similares (ricos, pobres, hogares con alto y bajo número de habitantes) - En 1849 cada caompañÃa sacaba agua del Thames que estaba contaminado. En 1852, LC mueve su infraestructura rÃo arriba en zonas del Thames con agua (más). SV no cambió nada - Un experimento natural ideal --- class: animated, fadeIn ## Resultados principales .pull-left[ <img src="data:image/png;base64,#02_img/snow1.png" width="75%" style="display: block; margin: auto;" /> ] .pull-right[ - Tenemos 2 grupos y 2 perÃodos que registran tasas de mortalidad por cólera y diarrea - Lambeth: grupo tratado - Southwalk: grupo de control - El efecto sobre los tratados (ATT) es de 10 muertes menos por cada 1,000 habitantes - Estimación simple comparando combinaciones de 2x2 ] --- class: animated, fadeIn ## Ejemplo 2: Empleo en industria de cómida rápida y salario mÃnimo **Card y Krueger (1994)** - La teorÃa económica predice que subir el salario mÃnimo reduce el empleo - Card y Krueger toman un experimento natural para revisar esta predicción - Abril 1, 1992: New Jersey sube su salario mÃnimo de 4.25 a 5.05 - No hubo cambios en estados vecinos - Oportunidad para un clásico DID - Datos: empleo en restaurantes de comida rápida en NJ y PA antes (Feb 1992) y después (Nov 1992) de este aumento en salario mÃnimo --- class: animated, fadeIn ## Distribución de la muestra <img src="data:image/png;base64,#02_img/card1.png" width="100%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Resultados principales <img src="data:image/png;base64,#02_img/card2.png" width="75%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Supuestos de Card y Krueger <br><br><br> - ¿Cuál es el supuesto detrás de este análisis? - ¿Porqué podrÃa no cumplirse? --- class: animated, fadeIn ## Visualización: Lo que estima DID <img src="data:image/png;base64,#02_img/did3.png" width="75%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Supuestos de Card y Krueger - **Supuesto de identificación**: El empleo en NJ y PA tendrÃa la misma tendencia en la ausencia del aumento en el salario mÃnimo (tratamiento). ¿Porqué no se cumplirÃa? **1** ¿Qué pasa si PA tiene distintas tendencias que NJ desde antes de la polÃtica? -- `\(\rightarrow\)` no se cumple el supuesto de tendencias paralelas - Revisar si las tendencias son similares antes del programa **2** ¿Qué pasa si otras cosas pasaron en NJ simultáneamente? -- `\(\rightarrow\)` no podemos interpretar el cambio como un efecto del salario mÃnimo (e.g. programas simultáneos de capacitación laboral) - Revisar si no hay otros programas en paralelo --- class: animated, fadeIn ## Ejemplo de problemas con tendencias paralelas - Un ejemplo clásico de no cumplimiento del supuesto de tendencias paralelas se da en programa s de capacitación laboral. En el proceso de auto-selección a un programa asÃ: - ¿cómo se espera que sean los salarios de quiénes se inscriben y no se inscriben? -- <img src="data:image/png;base64,#02_img/dip.png" width="70%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Efectos de programa de capacitación - Podemos construir distintos estimadores DID cambiando el año basal: no deberÃan cambiar <img src="data:image/png;base64,#02_img/dip2.png" width="75%" style="display: block; margin: auto;" /> - DID son similares para años basales pre-1963. - El supuesto parece ser más sostenible para años pre 1963. Estos deberÃan ocuparse para --- class: animated, fadeIn ## Resumen - Los supuestos de identificación son distintos para distintos estimadores que ocupan datos no experimentales: - Estimadores de corte transversal: no hay diferencias sistemáticas entre ambos grupos - Estimadores de diferencia: no hay tendencia contrafactual en la ausencia del tratamiento, o la variable de interés se mantiene constante en el tiempo en ausencia de programa - Estimadores de diferencias en diferencias: La tendencia observada en el grupo de control es la misma que la tendencia del contrafactual del tratamiento --- ## Importante - Estos son supuestos. No podemos (usualmente) probar si son correctos o no - Esta es la diferencia fundamental entre métodos experimentales y no experimentales - Para DID debemos argumentar los supuestos de identificación en base a: - Tendencias paralelas en perÃodos previos al programa - No hay otras intervenciones pasando al mismo tiempo - Sin embargo, esto solo hace el supuesto más creÃble ... **no lo prueba** --- class: animated, fadeIn ## Diferencias en Diferencias en formato de regresión `$$Y_{it} = \beta_0 + \beta_1 I_{it1} + \beta_2 D_{i} + \delta D_{i}\cdot I_{it1} + \varepsilon_{it}$$` - Dos periodos: `\(t=t_0,t_1\)` - `\(I_{it1}=1\)` para `\(t=t_1\)` y `\(I_{it0}=0\)` para `\(t=t_0\)` - `\(D_i=1\)` para el grupo de tratamiento y `\(D_i=0\)` poara el grupo de control - Entonces `\(\delta=\Delta^{DID}\)` - Demostración de `\(\hat{\delta}=(\bar{Y}^{T}_{1,t_1} - \bar{Y}^{T}_{0,t_0}) - (\bar{Y}^{C}_{0,t_1} - \bar{Y}^{C}_{0,t_0})\)` --- class: animated, fadeIn ## Diferencias en Diferencias en formato de regresión - Podemos incluir variables observables y controlar por ellas `$$Y_{it} = \beta_0 + \beta_1 I_{it1} + \beta_2 D_{i} + \delta D_{i}\cdot I_{it1} + X_{it}'\lambda + \varepsilon_{it}$$` - Esto solo se hace para corregir errores estándar o si creemos que hay alguna X relacionada con `\(D_{i}\)` - Se espera que al agregar variables de control no haya cambios significativos en `\(\hat{\delta}\)` --- class: animated, fadeIn ## Visualización: Lo que queremos estimar <img src="data:image/png;base64,#02_img/did1.png" width="75%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización: Lo que estima AD <img src="data:image/png;base64,#02_img/did2.png" width="75%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización: Lo que estima DID <img src="data:image/png;base64,#02_img/did3.png" width="75%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización: Horizonte temporal del problema <img src="data:image/png;base64,#02_img/ditela0.png" width="100%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización: Horizonte temporal del problema <img src="data:image/png;base64,#02_img/ditela1.png" width="100%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización: Horizonte temporal del problema <img src="data:image/png;base64,#02_img/ditela1_1.png" width="100%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## CaracterÃsticas de los segmentos censales <img src="data:image/png;base64,#02_img/ditela2.png" width="75%" style="display: block; margin: auto;" /> **¿Por qué mostrar esta tabla? ¿De qué nos están tratando de convencer los autores?** --- class: animated, fadeIn ## Evolución de robo de autos en el tiempo <img src="data:image/png;base64,#02_img/ditela2_1.png" width="75%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización de los efectos <img src="data:image/png;base64,#02_img/ditela3.png" width="100%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización de los efectos <img src="data:image/png;base64,#02_img/ditela4.png" width="100%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización de los efectos <img src="data:image/png;base64,#02_img/ditela5.png" width="100%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización de los efectos <img src="data:image/png;base64,#02_img/ditela6.png" width="100%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización de los efectos <img src="data:image/png;base64,#02_img/ditela7.png" width="100%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización de los efectos <img src="data:image/png;base64,#02_img/ditela8.png" width="100%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización de los efectos <img src="data:image/png;base64,#02_img/ditela9.png" width="100%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización de los efectos <img src="data:image/png;base64,#02_img/ditela10.png" width="100%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización de los efectos <img src="data:image/png;base64,#02_img/ditela11.png" width="100%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización de los efectos <img src="data:image/png;base64,#02_img/ditela12.png" width="100%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Visualización de los efectos <img src="data:image/png;base64,#02_img/ditela13.png" width="100%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Resultados <img src="data:image/png;base64,#02_img/ditela14.png" width="100%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Resultados <img src="data:image/png;base64,#02_img/ditela15.png" width="50%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Resultados <img src="data:image/png;base64,#02_img/ditela16.png" width="100%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Generalizando DiD a Efectos Fijos - Es común tener datos para más de dos perÃodos en donde la intervención puede ocurrir en distintos perÃodos para distintas unidades de análisis - Esto permite que el efecto del tratamiento varÃe en el tiempo --- class: animated, fadeIn ## Retomando la regresión de efectos fijos `$$Y_{it} = \delta D_{it} + \alpha_i + \eta_t + v_{it}$$` - ¿Qué cambio respecto a la notación anterior? - ¿Qué es `\(\alpha_i\)`? ¿Qué es `\(\eta_t\)`? - `\(\alpha_i\)`: componente del error que no varÃa en el tiempo - `\(\eta_t\)`: componente del error varÃa en el tiempo pero es común a todo `\(i\)` - `\(v_t\)`: factores no obs. que varÃan en el tiempo y por `\(i\)` --- class: animated, fadeIn ## Retomando la regresión de efectos fijos `$$Y_{it} = \delta D_{it} + \alpha_i + \eta_t + v_{it}$$` - ¿Por qué queremos controlar por `\(\alpha_i\)` o por `\(\eta_t\)`? - ¿Cuál es el supuesto de identificación de `\(\delta\)` si no controlamos por `\(\alpha_i\)` o `\(\eta_t\)`? - ¿Qué pasa si ahora controlamos por `\(\alpha_i\)` o `\(\eta_t\)`? --- class: animated, fadeIn ## Efectos en el tiempo - Podemos hacer una regresión en donde el efecto cambia en el tiempo: `$$Y_{it} = \sum^{J}_{j=0}\delta_j D_{i,k+j} + \alpha_i + \eta_t + v_{it}$$` - Supongamos que el tratamiento empieza en `\(t=k\)` - Definimos periodo después de tratamiento cómo `\(t=k+j\)`, donde `\(j=0,...,J\)` - Entonces, `\(\hat{\delta_j}\)` es el efecto del tratamiento en `\(t=k+j\)` - ¿Por qué nos gustarÃa modelar el efecto de esta forma? --- class: animated, fadeIn ## Ejemplo: impacto de bajas de impuestos a extranjeros sobre migración <img src="data:image/png;base64,#02_img/kleven1.png" width="50%" style="display: block; margin: auto;" /> - Se reducen los impuestos a extranjeros que ganan mucho en 1991 - Grupo de tratamiento: trabajadores extranjeros que ganan justo por sobre el tramo afectado - Grupo de control: trabajadores extranjeros que ganan justo por debajo del tramo afectado --- class: animated, fadeIn ## Ejemplo: impacto de bajas de impuestos a extranjeros sobre migración <img src="data:image/png;base64,#02_img/kleven2.png" width="50%" style="display: block; margin: auto;" /> - Grupo de tratamiento: trabajadores extranjeros que ganan justo por sobre el tramo afectado - Grupo de control: trabajadores extranjeros que ganan justo por debajo del tramo afectado - ¿Cuál es la estrategia de identificación? ¿Es posible? --- class: animated, fadeIn ## Efectos en el tiempo - En este ejemplo podemos estimar `$$Y_{it} = \sum^{J}_{j=0}\delta_j D_{i,k+j} + \alpha_i + \eta_t + v_{it}$$` - `\(Y\)`: número de trabajadores extranjeros (cómo base tomamos el año de 1990) - El tratamiento comienza en `\(t=1991\)` - Definimos el periodo después de tratamiento cómo `\(t=1991+j\)` donde `\(j=0,...,J\)` - Entonces `\(\hat{\delta_j}\)` es el efecto del tratamiento en `\(t=1991+j\)` - ¿Por qué nos gustarÃa modelar el efecto de esta forma? --- class: animated, fadeIn ## Resumen de DID y EF - DiD y EF son métodos útiles para análisis de datos de panel - Estos métodos proveen supuestos de identificación menos exigentes que el estimador de corte transversal (A-D) ode diferencias simple - En cualquiera de estos dos métodos hay que mostrar que (1) existen tendencias paralelas en perÃodos anteriores y (2) que no hay cambios en otras polÃticas al mismo tiempo - De todas formas los supuestos no son testeables.. Mostrar lo anterior sólo hace que nuestros supuestos sean más creÃbles. --- class: animated, fadeIn ## Ejemplo: Impacto de impuesto al tabaco sobre consumo <img src="data:image/png;base64,#02_img/kleven2.png" width="50%" style="display: block; margin: auto;" /> **¿Dónde es más probable que haya tendencias paralelas?** --- class: inverse middle center animated, fadeIn ## DUDAS --- name: despedida class: inverse, center, middle background-image: url(data:image/png;base64,#02_img/logo-uc.png) background-position: 50% 10% background-size: 10%, cover <br><br><br> ## Semana 5 ### Regresión Discontinua y Diferencias en Diferencias 01 de noviembre, 2022 <div class="my-footer"></div>
<b>Pablo A. Celhay</b> | [
pacelhay@uc.cl](mailto:pacelhay@uc.cl) .left[.footnote[ <br> Diseño y formato de la presentación:
José Daniel Conejeros | [
jdconejeros@uc.cl](mailto:jdconejeros@uc.cl) | [
JDConejeros](https://github.com/JDConejeros) ]]